Equilibrios de Nash en juegos de suma cero: un enfoque inspirado en la física
Descubre un método inspirado en la física que caracteriza equilibrios de Nash en juegos de suma cero. Paralelizable y más rápido que métodos tradicionales.
Descubre un método inspirado en la física que caracteriza equilibrios de Nash en juegos de suma cero. Paralelizable y más rápido que métodos tradicionales.
Acelera el RL online con envolventes de valor aprendidas de datos offline. Reduce el arrepentimiento y mejora resultados.
Descubre cómo FTPL se adapta a la curvatura en optimización online, logrando desde O(√T) hasta O(log T) de regret sin conocer la curvatura por adelantado.